Geração de um Perfil de Qualidade Para Fontes de Dados Dinâmicas

نویسندگان

  • Everaldo Costa Silva Neto
  • Bernadette Farias Lóscio
  • Ana Carolina Salgado
چکیده

Nowadays, a massive volume of data has been produced by a variety of data sources. The easy access to these data presents new opportunities. In this sense, choosing the most suitable data sources for a specific use has become a challenge. The literature contains many works that perform quality assessment in data sources as a mean of solving this issue. However, only few works take into account the dynamicity of sources. In this work, we address the problem of performing data quality assessment in dynamic data sources. Furthermore, we propose the establishment of a Quality Profile, which consists in a set of metadata that provides information about the quality of a data source. The experiments performed on real-world scenarios have demonstrated that our strategy produces satisfactory results. Resumo. Atualmente, um massivo volume de dados tem sido produzido pelos mais variados tipos de fontes de dados. A facilidade de acesso a esses dados apresenta novas oportunidades, no entanto, escolher quais fontes de dados são mais adequadas para um determinado uso tornou-se um desafio. A literatura oferece diversos trabalhos que abordam a avaliação da qualidade em fontes de dados como meio para solucionar esse desafio, entretanto, poucos trabalhos consideram o aspecto dinâmico das fontes. Neste trabalho, abordamos o problema de avaliação da qualidade em fontes de dados dinâmicas. Além disso, propomos a criação de um Perfil de Qualidade, que consiste de um conjunto de metadados que oferece dados sobre a qualidade de uma fonte e que poderá ser utilizado para facilitar o processo de seleção de fontes de dados. Os experimentos realizados demonstraram que a estratégia de avaliação da qualidade proposta produz resultados satisfatórios.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Registro de Procedência de Ligações RDF em Dados Ligados

As many tools have been created to support linked data consumption and publishing, there is a demand for quality assessment and to verify these data. To make this possible, data about this consumption should be recorded. This paper presents an extension to a framework with the goal to support the recording and publishing of the information about the creation and consumption of linked data, in o...

متن کامل

Uma Abordagem para Matching Icremental entre Ontologias

The discovery of semantic correspondences between schemas is an important task for different fields of applications such as data integration, data warehousing and data mashup. In most cases, the data sources involved are heterogeneous and dynamic, making correspondence discovery even harder. Ontologies are being used in order to define common vocabulary, which may be used to describe the elemen...

متن کامل

The language issue in Brazilian ophthalmological journals.

Nesta edição do Arquivos Brasileiros de Oftalmologia (ABO), Lira et al., estudaram a qualidade dos periódicos oftalmológicos brasileiros por meio do número de citações em fontes indexadas no Science Citation Index Expanded (SCIE) após dois anos da publicação (Fator de Impacto®) e da qualidade dos artigos de acordo com o Consolidated Standards for Reporting Trials (CONSORT). As publicações são e...

متن کامل

Uma Proposta de Perfil de Conjuntos de Dados na Web com Enriquecimento Semântico

The lack of metadata to describe datasets published on the Web makes their location and access by search engines or applications more difficult. Providing a dataset profile facilitates communication between publishers and consumers and also the integrated use of datasets. This paper proposes an approach that describes datasets on the Web by the generation of a semantically enriched descriptive ...

متن کامل

Gerência de Proveniência Multigranular em Linked Data com a Abordagem ETL4LinkedProv

This paper presents the ETL4LinkedProv approach to manage the collection and publication of provenance metadata with different levels of granularity, as Linked Data. The approach uses ETL workflows and a novel component named Provenance Collector Agent. Its application in a real scenario is presented and the impact of the fine-grained provenance in the ETL workflow runtime and in the number of ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2016